早上9:30,快遞公司人員準時出現在保險公司總部的櫃台,他每天固定準時來領取兩份包裹,一份送到5公里外的本地分公司,另一份送到100公里外另一個城市的分公司。兩個包裹裡裝的是一模一樣的東西 --- 昨天營運資料的備份磁帶。
當總部的電腦當機或資料毀損時,本地分公司的磁帶就派上用場了,可以在4小時內讓電腦系統重新上線營運;當火災、地震、洪水、海嘯等天災發生的時候,100公里外異地分公司的磁帶就派上用場了,可以在24 ~ 48小時內讓電腦系統重新上線營運。
這就是企業以前的備份體系,本地一份,異地一份。
時到今日,我們為什麼還要將同樣一份資料抄寫兩次,坐兩趟汽車,送到兩個地方,跟其他364天的磁帶卷堆放在一起。
一次就夠了!備份 (backup) 的觀念已經落伍了,我們現在需要的是複製 (replication)。
現在,我們有更好的網路頻寬和新的儲存技術,讓我們可以更直接、更快速、更即時、更有效率的複製更新過的資料到全世界任何地方。科技進步了,我們有足夠的技術將資料量縮減到非常之小,一些基於資料區塊 (block) 的儲存與傳輸方式可以大量減少複製的資料量,硬碟裡只有被更新過的資料區塊需要被傳輸,而de-dupe重複資料刪除技術可以將資料量縮減到20分之1,網路也有很好的壓縮傳輸科技。我們可以挑選單獨一種,或綜合上述幾種篩揀、刪除、與壓縮的技術來預先處理資料,大部分的企業每天產生的差異資料量都小於500 MB,甚至可以說小於100 MB,一般的網路頻寬就可以輕易地、即時地處理這幾百MB的資料傳輸。
我們只要透過網路將資料複製到遠端一次就可以了,時效急迫可以做即時的複製,時效寬裕可以做延遲的複製,完全沒有壓力。現在,電腦硬碟裡的資料只需要拷貝一次,而不用兩次三次,是不是讓人輕鬆愉快多了。
備份 (backup) 還有其他問題,製作兩三個備份分別放置在不同的地方,會造成資訊洩漏的安全問題,這足以讓企業倒閉。
備份的另一個問題是資料格式不同,備份的副本都是束諸高閣、「備而不用」。一旦災難發生,資料復原需要幾個小時到幾天的時間,這樣的時效不是現代的企業或是客戶可以接受的。
備份還有一個終極的問題,就是沒有人可以保證,備份的資料是否完整無缺而且確實可用。
複製 (replication) 就和藹可親多了,複製到異地的資料格式可以是相同的,可以立刻被取用的,所以複製過的副本是「既備且用」,這相當於負載平衡的功能,讓異地的副本確實可用的,異地的電腦設備也不會閒置無用。因此,用複製來取代備份,不僅達成原本資料異地備份的基本目標,更具有資料分散部署與負載平衡的高階能力。
而且,異地的電腦設備既可以上線,資料又能即時傳輸到位,所以無論是本地的主機或是異地的備援機都呈現工作的狀態。若是主機因為人為或天災而不能工作的時候,系統服務就自動轉移到備援機上,如此,資訊服務將不會停頓。因此,用複製來取代備份,不僅做到資料備援的基礎,更是系統備援的基礎。
最後,不要忘了雲端!把資料複製到雲端儲存設備,更簡單更經濟。忘記備份吧,讓我們擁抱複製。
<註> 名詞定義
科技名詞的意義雖專業卻往往界線模糊,為了討論的專注與避免誤會,先將幾個相關的專有名詞定義清楚:http://ithelp.ithome.com.tw/question/10076385
其實簡單的講就是...異地備援機制
您說的對,就是異地備援機制,讓 backup 漸漸式微。而科技與頻寬的進步,促進了異地備援機制的發展。
建了DR還是需要D2D2T
只是版大這樣分享
很散不好回復
摘錄重點
備份很難死
備份市場還是很大
重點在於要保護的是Service還是Data
如果是Data還是只能乖乖備份
remote replication需要的預算是最多的吧,優點是即時
backup至磁帶,磁帶可以有歷史版本,而單純的replication就無法找回歷史
說到雲,想到icloud,ios,shsh,更新ios之前通常都會備份shsh,我想apple很快就只提供ios5的shsh驗證了吧
大企業仍然會使用磁帶保持歷史紀錄,譬如說股票交易紀錄,所以我相信磁帶永遠有其價值。
我也見過證券公司將磁帶的交易紀錄倒回線上儲存設備,因為要做資料採礦與商業智慧分析,希望從過去的經驗,預測未來的股價趨勢。這是歷史紀錄的活化運用!
請參考這兩篇讀者投書 :
http://ithelp.ithome.com.tw/question/10076775
http://ithelp.ithome.com.tw/question/10077041
小弟是IT業務
在完整的IT架構裡
是無限追求系統的完整及安全
因為威脅不只是來自內部亦來自外面
版大所推行的複製
不過就是DR架構罷了
國內最常見就屬DataCore了
但是我想就能DataCore都不敢說不需要另外規劃D2D2T的架構
當然一昧保存資料是無意義的
簡單來說對於ERP Sever、File Sever來說
提供Service才是重點
對於DB、Mail Sever
保存Data才是重點
當老闆說:要我三天前那個被刪除的資料
DR救不了、HA沒有用
沒備份..........
下面我已經版大其他版發過,轉貼回來這邊。
備份很難死
備份市場還是很大
重點在於要保護的是Service還是Data
花了大錢建了HA,還是99.9999的要求
就不需要備份嗎?
特地找了一個風水好、地理佳、核電廠炸不到、戰爭靠邊站的地方做了DR架構
就不需要被備份嗎?
所以還是那個重點
要保護的是Service還是Data?
如果是Data還是只能乖乖備份
HA只能確保Service不中斷
不能確保可以還原資料
感謝您的意見,我正好藉此釐清一些容易造成誤會的地方:
維基百科的 '備份' 的條目提到:最好將重要資料製作三個,或三個以上的備份,並且放置在不同的場所,以利日後回存之用。
而「複製」指的是replication這個字眼,意義是一次的資料抄寫 (copy)。以現在的儲存技術與網路頻寬,我們只需要將資料複製一次到異地即可,而不用做三個以上備份放置在不同的地方。這樣的資料副本,當然也具有保存歷史紀錄的能力。
兩者所不同的是,副本從三份變成一份,執行效率從排程備份變成即時複製。
目前只討論到 Data的部分,還沒有討論到 HA、DR 等高階應用。將會陸續說明 '即時複製' 可以提供高可用性與服務不中斷等附加價值。
我相信對於名詞的認知不同會造成討論時的誤差,所以事先定義了相關名詞,請參考這篇 http://ithelp.ithome.com.tw/question/10076385
pluto 大大
其實您所說的"複製"不就是在討論DR或者該說Storage HA
您所說的名詞定義小弟之前有看過
所以這時我想因該從新討論"備份"一詞
備份是為了日後回存之用
而日後回存的時機為何?
系統損壞? 資料遺失? 資料異常?
即時複製很早就在推動了
以敝公司為例推動的產品就所DataCore跟promise的S3000
二者的作用就是將Data即時複製一份寫入"其他的儲存空間"
當這個"其他的儲存空間"位於Lan我們管他為Storage HA
位於WAN就是DR架構
總結一下上述一堆廢話
對於老闆觀點來看就是"打造一個Storage毀損後可以立即恢復的系統"
而不是一個Data被刪除可立即恢復的系統
即時複製也代表著即時刪除
那麼何以說備份已死